로지스틱 분포
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
로지스틱 분포는 확률 변수 x에 대해 정의되는 연속 확률 분포로, 누적 분포 함수와 확률 밀도 함수를 사용하여 나타낼 수 있다. 이 분포는 기댓값이 μ이고 분산이 이며, 왜도는 0, 첨도는 1.2의 값을 갖는다. 로지스틱 분포는 누적 분포 함수, 확률 밀도 함수, 분위 함수, 모멘트 등 다양한 성질을 가지며, 로지스틱 회귀, 물리학, 수문학, 체스 레이팅 등 여러 분야에 응용된다. 또한, 쌍곡선 정규 분포와 관련 있으며, 다양한 분포와의 관계를 갖는다.
로지스틱 분포는 확률 변수 x (-∞ < x < ∞)에 대해 정의되며, 누적 분포 함수와 확률 밀도 함수는 다음과 같다.
로지스틱 분포는 스케일 매개변수 s를 표준 편차 σ로 표현하여 매개변수화할 수 있다. 이때 s = qσ를 사용하며, 여기서 q = √3/π = 0.551328895…이다.
로지스틱 분포는 누적 분포 함수(로지스틱 함수) 및 분위 함수(로짓 함수)의 S자형 패턴을 가져 다양한 분야에서 널리 사용된다.
2. 정의 및 성질
누적 분포 함수는 다음과 같다.
:
확률 밀도 함수는 다음과 같다.
:
이때, 기댓값은 이고, 분산은 이다. 왜도는 0으로 정규 분포와 마찬가지로 평균을 중심으로 대칭이지만, 첨도는 = 1.2이다.
2. 1. 누적 분포 함수
로지스틱 분포는 그 이름이 누적 분포 함수에서 유래되었으며, 이는 로지스틱 함수의 한 예시이다. 로지스틱 분포의 누적 분포 함수는 또한 쌍곡선 탄젠트의 크기 조정된 버전이기도 하다.
:
이 식에서 는 평균이며, 는 표준 편차에 비례하는 척도 매개변수이다.
확률 변수를 실수 ( -∞ < < ∞ )로 할 때 로지스틱 분포는
누적 분포 함수 가
:
이다.
2. 2. 확률 밀도 함수
확률 밀도 함수는 누적 분포 함수의 편미분이다.
:
위치 모수가 0이고 척도 모수가 1일 때, 로지스틱 분포의 확률 밀도 함수는 다음과 같다.
:
이 함수는 쌍곡선 함수 "sech"의 제곱으로 표현될 수 있기 때문에, 때때로 ''sech-제곱 분포''라고도 한다.[2]
2. 3. 분위 함수
역 누적 분포 함수(분위 함수)는 로지스틱 분포의 일반화된 로짓 함수이다. 이의 도함수는 분위 밀도 함수라고 한다. 다음과 같이 정의된다.
:
:
2. 4. 모멘트
기댓값은 μ이고, 분산은 이다. 왜도는 0으로 정규 분포와 마찬가지로 평균을 중심으로 대칭이지만, 첨도는 = 1.2이다.
n차 중심 모멘트는 분위수 함수를 사용하여 표현할 수 있다.
:
이 적분은 잘 알려져 있으며, 베르누이 수를 사용하여 표현할 수 있다.
:
2. 5. 기타 성질
3. 매개변수화
4. 응용
4. 1. 로지스틱 회귀
로지스틱 분포는 누적 분포 함수(로지스틱 함수) 및 분위 함수(로짓 함수)의 S자형 패턴과 함께 다양한 분야에서 광범위하게 사용되어 왔다.
가장 일반적인 응용 분야 중 하나는 로지스틱 회귀이며, 이는 표준 선형 회귀가 연속 변수(예: 소득 또는 인구)를 모델링하는 데 사용되는 것과 마찬가지로 범주형 변수(예: 예-아니오 선택 또는 3~4개의 가능성 중 선택)를 모델링하는 데 사용된다. 특히, 로지스틱 회귀 모델은 로지스틱 분포를 따르는 오차 변수를 가진 잠재 변수 모델로 표현될 수 있다. 이 표현은 로지스틱 분포가 프로빗 회귀에서 정규 분포가 하는 역할과 동일한 역할을 하는 이산 선택 모델의 이론에서 흔히 사용된다. 실제로 로지스틱 분포와 정규 분포는 매우 유사한 형태를 가지고 있다. 그러나 로지스틱 분포는 꼬리가 두꺼운 분포를 가지므로, 정규 분포를 사용하는 것과 비교하여 이를 기반으로 하는 분석의 강건 통계가 종종 증가한다.
4. 2. 물리학
로지스틱 분포의 확률 밀도 함수(PDF)는 페르미 함수의 도함수와 동일한 형태를 갖는다. 이는 반도체 및 금속 내 전자의 특성 이론에서 전자 수송에 기여하는 다양한 전자 에너지의 상대적 가중치를 설정하는 데 사용된다. 에너지 수준이 분포의 "평균"(페르미 준위)에 가장 가까운 경우 전자 전도와 같은 과정에서 지배적인 역할을 하며, 온도로 인해 약간의 퍼짐이 유발된다.[3] 그러나 페르미-디랙 통계에서 관련된 ''확률'' 분포는 실제로는 간단한 베르누이 분포이며, 확률 인자는 페르미 함수에 의해 주어진다.
4. 3. 수문학
수문학에서 장기간의 하천 유량 및 강우량(예: 월별 및 연간 총량, 각각 30일 및 360일 값의 합으로 구성)의 분포는 중심 극한 정리에 따라 거의 정규 분포를 따른다고 생각되는 경우가 많다.[5] 그러나 정규 분포는 수치 근사가 필요하다. 분석적으로 해결할 수 있는 로지스틱 분포는 정규 분포와 유사하므로 대신 사용할 수 있다. 파란색 그림은 거의 정규 분포를 따르는 10월 강우량에 로지스틱 분포를 적합하는 예시를 보여주며, 이항 분포를 기반으로 하는 90% 신뢰 벨트를 보여준다. 강우 데이터는 누적 빈도 분석의 일부로 플로팅 위치로 표시된다.
4. 4. 체스 레이팅
미국 체스 연맹과 국제 체스 연맹(FIDE)은 체스 레이팅 계산 공식을 정규 분포에서 로지스틱 분포로 변경했다. 자세한 내용은 엘로 레이팅 시스템 문서를 참조할 수 있다. (엘로 레이팅 시스템 자체는 정규 분포에 기반한다.)
5. 관련 분포
- 로지스틱 분포는 쌍곡선 정규 분포를 모방하며, 이는 Champernowne 분포의 다른 경우이다.
- 만약 라면 이다.
- 만약 U(0, 1)라면 이며, 여기서 는 로짓 함수이다.
- 만약 이고 가 독립적이라면 이다.
- 만약 와 라면 이다 (합은 로지스틱 분포가 ''아니다''). .
- 만약 ''X'' ~ 로지스틱(''μ'', ''s'')라면 exp(''X'') ~ 로그 로지스틱이고, exp(''X'') + ''γ'' ~ 이동된 로그 로지스틱이다.
- 만약 ''X'' ~ 지수(1)라면
:::
- 만약 ''X'', ''Y'' ~ 지수(λ)가 독립적이라면
:::
- 메탈로그 분포는 로지스틱 분포의 일반화이며, 여기서 에 대한 거듭제곱 급수 전개가 로지스틱 매개변수 와 대신 사용된다. 결과적인 메탈로그 분위 함수는 매우 유연한 형태를 가지며, 단순한 폐쇄 형식을 가지며, 최소 제곱법을 사용하여 데이터에 맞출 수 있다.
참조
[1]
논문
Calculating CVaR and bPOE for common probability distributions with application to portfolio optimization and density estimation
http://uryasev.ams.s[...]
Springer
2023-02-27
[2]
문서
Johnson, Kotz & Balakrishnan (1995, p.116)
[3]
서적
The Physics of Low-dimensional Semiconductors: An Introduction
Cambridge University Press
[4]
간행물
A damped telegraph random process with logistic stationary distribution
Applied Probability Trust
[5]
서적
Frequency and Regression Analysis
https://archive.org/[...]
Chapter 6 in: Drainage Principles and Applications, Publication 16, International Institute for Land Reclamation and Improvement (ILRI), Wageningen, The Netherlands
[6]
기타
OEIS2C
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com